智能论文笔记

Statistical Properties of the log-cosh Loss Function Used in Machine Learning

Resve A. Saleh , A. K. Md. Ehsanes Saleh

分类： (统计)机器学习 | 机器学习

2022-08-09

本文分析了机器学习中使用的流行损失函数，称为log-cosh损失函数。已经使用此损失函数发表了许多论文，但迄今为止，文献中尚未介绍统计分析。在本文中，我们介绍了对日志cosh损失的分布函数。我们将其与类似的分布进行比较，称为Cauchy分布，并执行了特征其性质的各种统计程序。特别是，我们检查了其相关的PDF，CDF，似然函数和Fisher信息。并排考虑具有渐近偏置，渐近方差和置信区间的位置参数的MLE的cauchy和COSH分布。我们还提供了来自其他几个损失函数的强大估计器的比较，包括Huber损失函数和等级分散函数。此外，我们检查了对数字-COSH函数在分位数回归中的使用。特别是，我们确定了一个分位数分布函数，可以从中得出最大似然估计量。最后，我们将基于log-cosh的分位数m静态器与稳健的单调性与基于卷积平滑的另一种分位回归方法进行比较。

translated by 谷歌翻译

Solution to the Non-Monotonicity and Crossing Problems in Quantile Regression

Resve A. Saleh , A. K. Md. Ehsanes Saleh

分类： (统计)机器学习 | 机器学习

2021-11-08

本文提出了一种解决估计条件和结构分体函数估计缺乏单调性的长期问题的新方法，也称为定量交叉问题。分位数回归是一般和经济学中的数据科学中的一个非常强大的工具。不幸的是，横穿问题一直混淆研究人员和从业者，以40多年了。已经进行了许多尝试来查找可接受的解决方案，但未发现任何简单和一般的解决方案。本文介绍了基于单个数学方程式的问题的优雅解决方案，该方程易于理解和实现在R和Python中，同时大大减少了交叉问题。在定期回归经常使用的所有领域，也可能在强大的回归中找到应用程序，尤其是在机器学习的背景下，这将是非常重要的。

translated by 谷歌翻译

Data-driven control of COVID-19 in buildings: a reinforcement-learning approach

Ashkan Haji Hosseinloo , Saleh Nabi , Anette Hosoi , Munther A. Dahleh

分类：人工智能 | 机器学习

2022-12-27

In addition to its public health crisis, COVID-19 pandemic has led to the shutdown and closure of workplaces with an estimated total cost of more than $16 trillion. Given the long hours an average person spends in buildings and indoor environments, this research article proposes data-driven control strategies to design optimal indoor airflow to minimize the exposure of occupants to viral pathogens in built environments. A general control framework is put forward for designing an optimal velocity field and proximal policy optimization, a reinforcement learning algorithm is employed to solve the control problem in a data-driven fashion. The same framework is used for optimal placement of disinfectants to neutralize the viral pathogens as an alternative to the airflow design when the latter is practically infeasible or hard to implement. We show, via simulation experiments, that the control agent learns the optimal policy in both scenarios within a reasonable time. The proposed data-driven control framework in this study will have significant societal and economic benefits by setting the foundation for an improved methodology in designing case-specific infection control guidelines that can be realized by affordable ventilation devices and disinfectants.

translated by 谷歌翻译

Traffic incident duration prediction via a deep learning framework for text description encoding

Artur Grigorev , Adriana-Simona Mihaita , Khaled Saleh , Massimo Piccardi

分类：机器学习

2022-09-19

由于时空事件发生的随机性，在报告的交通中断开始时缺乏信息，并且缺乏运输工程的高级方法来从过去中获得见解，因此预测交通事故持续时间是一个难题事故。本文提出了一个新的Fusion框架，用于通过将机器学习与交通流量/速度和事件描述作为功能进行集成来预测有限信息的事件持续时间，并通过多种深度学习方法编码（ANN AUTOCONEDER和角色级别的LSTM-ANN情绪分类器）。该论文在运输和数据科学中构建了跨学科建模方法。该方法提高了适用于基线事件报告的最佳表现ML模型的入射持续时间预测准确性。结果表明，与标准线性或支持矢量回归模型相比，我们提出的方法可以提高准确性$ 60 \％$，并且相对于混合深度学习自动编码的GBDT模型的另外7美元\％$改进，这似乎胜过表现所有其他模型。应用区是旧金山市，富含交通事件日志（全国交通事故数据集）和过去的历史交通拥堵信息（Caltrans绩效测量系统的5分钟精度测量）。

translated by 谷歌翻译

A lightweight Transformer-based model for fish landmark detection

Alzayat Saleh , David Jones , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-09-13

当有足够的训练数据时，在某些视力任务中，基于变压器的模型（例如Vision Transformer（VIT））可以超越跨趋化神经网络（CNN）。然而，（CNN）对视力任务（即翻译均衡和局部性）具有强大而有用的归纳偏见。在这项工作中，我们开发了一种新颖的模型架构，我们称之为移动鱼类地标检测网络（MFLD-NET）。我们已经使用基于VIT的卷积操作（即斑块嵌入，多层感知器）制作了该模型。 MFLD-NET可以在轻巧的同时获得竞争性或更好的结果，同时轻巧，因此适用于嵌入式和移动设备。此外，我们表明MFLD-NET可以在PAR上获得关键点（地标）估计精度，甚至比FISH图像数据集上的某些最先进的（CNN）更好。此外，与VIT不同，MFLD-NET不需要预训练的模型，并且在小型数据集中训练时可以很好地概括。我们提供定量和定性的结果，以证明该模型的概括能力。这项工作将为未来开发移动但高效的鱼类监测系统和设备的努力奠定基础。

translated by 谷歌翻译

AlexaTM 20B: Few-Shot Learning Using a Large-Scale Multilingual Seq2Seq Model

Saleh Soltan , Shankar Ananthakrishnan , Jack FitzGerald , Rahul Gupta , Wael Hamza , Haidar Khan , Charith Peris , Stephen Rawls , Andy Rosenbaum , Anna Rumshisky

分类：自然语言处理 | 机器学习

2022-08-02

在这项工作中，我们证明了多种语的大规模序列到序列（SEQ2SEQ）模型，该模型是通过Denoising和因果语言建模（CLM）任务的混合物进行训练的，比仅解码器模型更有效地进行了效率的学习者在各种任务上。特别是，我们培训了一个名为Alexa教师模型（Alexatm 20b）的200亿个参数多语言SEQ2SEQ模型，并表明它在1-Shot摘要任务上实现了最先进的（SOTA）性能，超过了更大的540B PALM DOPODER模型。 Alexatm 20b还可以在1-Shot Machine翻译中实现SOTA，尤其是对于低资源语言，几乎所有语言对（阿拉伯语，英语，法语，德语，德语，印地语，意大利语，日语，以及flores-101数据集上的泰卢固语）。我们还显示了零拍设置，AlexATM 20B在SuperGlue和SqueadV2数据集上的表现优于GPT3（175B），并在XNLI，XCOPA，PAWS-X和XWINOGRAD等多语言任务上提供SOTA性能。总体而言，我们的结果为SEQ2SEQ模型提供了一个令人信服的案例，作为大型语言模型（LLM）培训的仅解码器模型的强大替代方法。

translated by 谷歌翻译

ENS-10: A Dataset For Post-Processing Ensemble Weather Forecast

Saleh Ashkboos , Langwen Huang , Nikoli Dryden , Tal Ben-Nun , Peter Dueben , Lukas Gianinazzi , Luca Kummer , Torsten Hoefler

分类：机器学习

2022-06-29

后处理整体预测系统可以改善天气预报，尤其是对于极端事件预测。近年来，已经开发出不同的机器学习模型来提高后处理步骤的质量。但是，这些模型在很大程度上依赖数据并生成此类合奏成员需要以高计算成本的数值天气预测模型进行多次运行。本文介绍了ENS-10数据集，由十个合奏成员组成，分布在20年中（1998-2017）。合奏成员是通过扰动数值天气模拟来捕获地球的混乱行为而产生的。为了代表大气的三维状态，ENS-10在11个不同的压力水平以及0.5度分辨率的表面中提供了最相关的大气变量。该数据集以48小时的交货时间针对预测校正任务，这实质上是通过消除合奏成员的偏见来改善预测质量。为此，ENS-10为预测交货时间t = 0、24和48小时（每周两个数据点）提供了天气变量。我们在ENS-10上为此任务提供了一组基线，并比较了它们在纠正不同天气变量预测时的性能。我们还评估了使用数据集预测极端事件的基准。 ENS-10数据集可在创意共享归因4.0国际（CC By 4.0）许可下获得。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

AMI-FML: A Privacy-Preserving Federated Machine Learning Framework for AMI

Milan Biswal , Abu Saleh Md Tayeen , Satyajayant Misra

分类：机器学习

2021-09-13

基于机器学习（ML）的智能仪表数据分析对于先进的计量基础设施（AMI）中的能源管理和需求 - 响应应用非常有前途。开发AMI的分布式ML应用程序中的一个关键挑战是保留用户隐私，同时允许有效的最终用户参与。本文解决了这一挑战，并为AMI中的ML应用程序提出了隐私保留的联合学习框架。我们将每个智能仪表视为托管使用中央聚合器或数据集中器的信息的ML应用程序的联邦边缘设备。而不是传输智能仪表感测的原始数据，ML模型权重被传送到聚合器以保护隐私。聚合器处理这些参数以设计可以在每个边缘设备处替换的鲁棒ML模型。我们还讨论了在共享ML模型参数的同时提高隐私和提高通信效率的策略，适用于AMI中的网络连接相对较慢。我们展示了在联合案例联盟ML（FML）应用程序上的提议框架，其提高了短期负荷预测（STLF）。我们使用长期内存（LSTM）经常性神经网络（RNN）模型进行STLF。在我们的体系结构中，我们假设有一个聚合器连接到一组智能电表。聚合器使用从联合智能仪表接收的学习模型渐变，以生成聚合，鲁棒RNN模型，其提高了个人和聚合STLF的预测精度。我们的结果表明，通过FML，预测精度增加，同时保留最终用户的数据隐私。

translated by 谷歌翻译

JRDB-Act: A Large-scale Dataset for Spatio-temporal Action, Social Group and Activity Detection

Mahsa Ehsanpour , Fatemeh Saleh , Silvio Savarese , Ian Reid , Hamid Rezatofighi

分类：计算机视觉

2021-06-16

大规模视频操作的可用性了解数据集在解释包含人员的视觉场景的解释方面有助于进步。然而，学会识别人类的行为和他们在包括众多人的不受约束的现实环境中的社交互动，具有来自移动机器人平台捕获的感官数据流的潜在高度不平衡和长尾的分布式动作标签仍然是一个重大挑战，由于缺乏反射性大型数据集而不是。在本文中，我们介绍了JRDB-ACT，作为现有JRDB的延伸，由社交移动机械手捕获，并反映了大学校园环境中的人类日常生活行为的真正分布。 JRDB-ACT浓密地用原子动作注释，包括超过2.8M的动作标签，构成了大规模的时空动作检测数据集。每个人的边界盒用一个基于姿势的动作标签和多个基于〜（可选）的基于交互的动作标签标记。此外，JRDB-ACT提供社会团体注释，有助于根据其在现场的互动来推断他们的社会活动〜（每个社会群体的共同活动）进行分组个人的任务。 JRDB-ACT中的每个注释标签都标有注释器的置信水平，这有助于开发可靠的评估策略。为了演示如何有效地利用这种注释，我们开发了端到端的培训管道，以学习和推断这些任务，即个人行动和社会群体检测。数据和评估代码在https://jrdb.erc.monash.edu/上公开可用。

translated by 谷歌翻译